智能论文笔记

Disentangled Counterfactual Recurrent Networks for Treatment Effect Inference over Time

Jeroen Berrevoets , Alicia Curth , Ioana Bica , Eoin McKinney , Mihaela van der Schaar

分类：机器学习

2021-12-07

选择每个患者的最佳治疗计划需要随着时间的推移而准确地预测其结果轨迹的函数。虽然大型观察数据集构成丰富的信息来源，但他们也包含偏差，因为处理很少在实践中随机分配。为了提供准确和无偏见的预测，我们介绍了解除戒备的反事实经常性网络（DCRN），一种新的序列到序列架构，其通过学习患者历史的时间随时间估计治疗结果，这些历史记录被解除为三个单独的潜在因子：治疗因素，影响只有治疗选择;结果因素，影响结果;和一个混杂因素，影响两者。通过架构，完全受到治疗影响的因果结构随着时间的推移，我们推进预测准确性和疾病的理解，因为我们的建筑允许从业者推断哪个患者的轨迹影响哪些患者的轨迹，对比该领域的其他方法对比其他方法。我们证明DCRN在预测治疗响应中的当前最先进的方法，在实际和模拟数据中优于最新的方法。

translated by 谷歌翻译

Counterfactual Explanations for Misclassified Images: How Human and Machine Explanations Differ

Eoin Delaney , Arjun Pakrashi , Derek Greene , Mark T. Keane

分类：机器学习 | 人工智能 | 计算机视觉

2022-12-16

Counterfactual explanations have emerged as a popular solution for the eXplainable AI (XAI) problem of elucidating the predictions of black-box deep-learning systems due to their psychological validity, flexibility across problem domains and proposed legal compliance. While over 100 counterfactual methods exist, claiming to generate plausible explanations akin to those preferred by people, few have actually been tested on users ($\sim7\%$). So, the psychological validity of these counterfactual algorithms for effective XAI for image data is not established. This issue is addressed here using a novel methodology that (i) gathers ground truth human-generated counterfactual explanations for misclassified images, in two user studies and, then, (ii) compares these human-generated ground-truth explanations to computationally-generated explanations for the same misclassifications. Results indicate that humans do not "minimally edit" images when generating counterfactual explanations. Instead, they make larger, "meaningful" edits that better approximate prototypes in the counterfactual class.

translated by 谷歌翻译

Improving self-supervised representation learning via sequential adversarial masking

Dylan Sam , Min Bai , Tristan McKinney , Li Erran Li

分类：计算机视觉 | 机器学习

2022-12-16

Recent methods in self-supervised learning have demonstrated that masking-based pretext tasks extend beyond NLP, serving as useful pretraining objectives in computer vision. However, existing approaches apply random or ad hoc masking strategies that limit the difficulty of the reconstruction task and, consequently, the strength of the learnt representations. We improve upon current state-of-the-art work in learning adversarial masks by proposing a new framework that generates masks in a sequential fashion with different constraints on the adversary. This leads to improvements in performance on various downstream tasks, such as classification on ImageNet100, STL10, and CIFAR10/100 and segmentation on Pascal VOC. Our results further demonstrate the promising capabilities of masking-based approaches for SSL in computer vision.

translated by 谷歌翻译

Megapixel Image Generation with Step-Unrolled Denoising Autoencoders

Alex F. McKinney , Chris G. Willcocks

分类：计算机视觉 | 机器学习

2022-06-24

生成建模研究的持续趋势是将样本分辨率推高更高，同时减少培训和采样的计算要求。我们的目标是通过技术的组合进一步推动这一趋势 - 每个组件代表当前效率在各自领域的顶峰。其中包括载体定量的GAN（VQ-GAN），该模型具有高水平的损耗 - 但感知上微不足道的压缩模型；沙漏变形金刚，一个高度可扩展的自我注意力模型；和逐步未胶片的denoising自动编码器（Sundae），一种非自动化（NAR）文本生成模型。出乎意料的是，当应用于多维数据时，我们的方法突出了沙漏变压器的原始公式中的弱点。鉴于此，我们建议对重采样机制进行修改，该机制适用于将分层变压器应用于多维数据的任何任务。此外，我们证明了圣代表到长序列长度的可伸缩性 - 比先前的工作长四倍。我们提出的框架秤达到高分辨率（$ 1024 \ times 1024 $），并迅速火车（2-4天）。至关重要的是，训练有素的模型在消费级GPU（GTX 1080TI）上大约2秒内生产多样化和现实的百像样品。通常，该框架是灵活的：支持任意数量的采样步骤，示例自动插入，自我纠正功能，有条件的生成和NAR公式，以允许任意介绍掩护。我们在FFHQ256上获得10.56的FID得分 - 仅在100个采样步骤中以不到一半的采样步骤接近原始VQ -GAN，而FFHQ1024的FFHQ1024和21.85。

translated by 谷歌翻译

Robust and Efficient Medical Imaging with Self-Supervision

Shekoofeh Azizi , Laura Culp , Jan Freyberg , Basil Mustafa , Sebastien Baur , Simon Kornblith , Ting Chen , Patricia MacWilliams , S. Sara Mahdavi , Ellery Wulczyn

分类：计算机视觉 | 人工智能 | 机器学习

2022-05-19

医疗人工智能（AI）的最新进展已提供了可以达到临床专家水平绩效的系统。但是，当在与训练环境不同的临床环境中评估时，这种系统往往会证明次优的“分布式”性能。一种常见的缓解策略是使用特定地点数据为每个临床环境开发单独的系统[1]。但是，这很快变得不切实际，因为医疗数据很耗时，可以注释且昂贵[2]。因此，“数据有效概括”的问题给医学AI开发带来了持续的困难。尽管代表性学习的进展显示出希望，但并未对其好处进行严格的研究，特别是用于分布的设置。为了应对这些挑战，我们提出了RESEDIS，这是一种统一的代表学习策略，以提高医学成像AI的鲁棒性和数据效率。雷雷迪斯使用大规模监督转移学习与自我监督学习的通用组合，几乎不需要特定于任务的自定义。我们研究各种医学成像任务，并使用回顾性数据模拟三个现实的应用程序场景。 RESEDIS表现出明显改善的分布性能，而在强有力的基线上，诊断准确性相对相对提高了11.5％。更重要的是，我们的策略会导致对医学成像AI的强大数据有效的概括，并使用跨任务的1％至33％的重新培训数据匹配强有力的监督基线。这些结果表明，Repedis可以显着加速医学成像AI开发的生命周期，从而为医学成像AI提供了重要的一步，以产生广泛的影响。

translated by 谷歌翻译

Non-Intrusive Binaural Speech Intelligibility Prediction from Discrete Latent Representations

Alex F. McKinney , Benjamin Cauchi

分类：机器学习

2021-11-24

来自双耳信号的非侵入式语音可懂度（SI）预测在许多应用中都很有用。然而，大多数现有的基于信号的措施被设计为应用于单通道信号。专门设计用于考虑信号的双耳属性的措施通常是侵扰的，其特征在于需要访问清洁语音信号 - 并且通常依赖于在进行预测之前将两个通道组合到单通道信号中。本文提出了一种非侵入式SI测量，其使用矢量量化（VQ）和对比预测编码（CPC）方法的组合计算来自双耳输入信号的特征。 VQ-CPC功能提取不依赖于听觉系统的任何模型，而是培训以最大化输入信号和输出功能之间的相互信息。计算的VQ-CPC特征被输入到由神经网络参数化的预测功能。本文考虑了两种预测功能。两个特征提取器和预测功能都接受了具有各向同性噪声的模拟双耳信号。它们在具有各向同性和真实噪声的模拟信号上进行测试。对于所有信号，地面真相分数是（侵入式）确定性化双耳stoi。结果以相关性和MSE提供给出，并证明VQ-CPC功能能够捕获与建模SI相关的信息，并且越优于所有被考虑的基准 - 即使在评估包括不同噪声场类型的数据时也是如此。

translated by 谷歌翻译

Exploiting Invariance in Training Deep Neural Networks

Chengxi Ye , Xiong Zhou , Tristan McKinney , Yanfeng Liu , Qinggang Zhou , Fedor Zhdanov

分类：计算机视觉 | 人工智能 | 机器学习

2021-03-30

灵感来自动物视觉系统中的两个基本机制，我们介绍了一种特征变换技术，在深神经网络训练中强加不变性。生成的算法需要较少的参数调整，用初始学习速率1.0提供良好的列车，并且容易地推广到不同的任务。我们使用数据中的本地统计数据强制不变性，以使类似的样本对齐不同的标度。为了加速融合，我们强制使用从批处理中提取的全局统计数据来执行GL（n）-invariance属性，使得梯度下降溶液应保持不变的基础变化。分析分析表明我们所提出的修改需要底层卷积层的计算的5％。在卷积网络和变压器网络上测试，我们提出的技术需要较少的迭代训练，超过所有基线，通过大幅度，无缝工作，对小型和大批量训练，并适用于不同的计算机视觉和语言任务。

translated by 谷歌翻译